Automates lexico-phonétiques pour l'indexation et la recherche de segments de parole (Lexical-phonetic automata for spoken utterance indexing and retrieval) [in French]

نویسندگان

  • Julien Fayolle
  • Fabienne Moreau
  • Christian Raymond
  • Guillaume Gravier
چکیده

Lexical-phonetic automata for spoken utterance indexing and retrieval This paper presents a method for indexing spoken utterances which combines lexical and phonetic hypotheses in a hybrid index built from automata. The retrieval is realised by a lexical-phonetic and semi-imperfect matching whose aim is to improve the recall. A feature vector, containing edit distance scores and a confidence measure, weights each transition to help the filtering of the candidate utterance list for a more precise search. Experiment results show that the lexical and phonetic representations are complementary and we compare the hybrid search with the state-of-the-art cascaded search to retrieve named entity queries. MOTS-CLÉS : recherche d’information, indexation de parole, représentations lexico-phonétiques, automates et transducteurs, mesures de confiance, distances d’édition, apprentissage supervisé.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Lexical-phonetic automata for spoken utterance indexing and retrieval

This paper1 presents a method for indexing spoken utterances which combines lexical and phonetic hypotheses in a hybrid index built from automata. The retrieval is realised by a lexical-phonetic and semi-imperfect matching whose aim is to improve the recall. A feature vector, containing edit distance scores and a confidence measure, weights each transition to help the filtering of the candidate...

متن کامل

On the use of an auditory mode! and phonetic knowledge for automatic speech recognition

L'introduction de connaissances dans les systèmes de reconnaissance de parole (RAP) est un bon m yen d'aeôliorer les performances des systèmes actuels . Dans cet article nous proposons le système ORION dans le cadre d'une application de reconnaissance multilocuteur de mots isolés . ORION est un système hybride à deux passes intégrant plusieurs sources de connaissances : psychoacoustiques, physi...

متن کامل

Violence du langage dans l’œuvre dramatique de Samuel Beckett : la quête du néant

L’homme beckettien représente grosso modo sur la scène de théâtre des années cinquante le spectacle de souffrance physique et de désintégration totale du sujet qui est le fait d’un trauma et d’un complexe plus profonds, celui du vide de matières scéniques et du mal fondamental qu’on traiterait d’existentiel. En d’autres termes, le mal est dans ce monde quelque chose d’inné chez l’être humain. C...

متن کامل

Amélioration des Performances des Systèmes Automatiques de Reconnaissance de la Parole pour la Parole Non Native

Résumé Dans cet article nous décrivons une approche pour la reconnaissance automatique de la parole (RAP) non native. Nous proposons deux méthodes pour l’adaptation d’un système de reconnaissance automatique de la parole (SRAP) existant. La première se base sur la modification des modèles acoustiques par l’intègration des modèles de la langue maternelle (LM). Les phonèmes de la langue parlée (L...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2012